13996527831
详细

移动适配方法应该如何选择?

发表日期:2016-05-31 18:24:26   作者来源:米卓网络   浏览:    

  如今移动适配的规则多种多样,有搜狗适配、谷歌适配、百度适配等适配规则,每种适配针对的目标也不同,那站长该如何选择呢?

移动适配方法应该如何选择?

  搜狗适配是提交XML文件,文件中以PC以及对应的URL,将整站适配的URL均添加跳转。当然,首先要给到正则式的PC以及移动URL对应的规则,根据规则来提交URL。

  百度则是在PC和移动端中,添加对应的URL,如,PC指向对应的移动页面URL,移动则相反。谷歌原理相同,只是适配规则代码不同罢了。

  那该如何选择呢?首先是针对网站重点优化的搜索引擎,如重点针对搜狗搜索引擎,那自然是制作XML文件,提交搜狗站长平台。

  在近期,百度站长平台更新一则最新的适配规则,巧合的是,适配代码与谷歌相同,这让站长更迷惑了。当然,有办法,百度站长平台适配规则,老版与新版,百度均认同,新版则与谷歌相同。我们可以百度旧版与新版适配规则都添加,这样,又可以对应谷歌适配,皆大欢喜。

  最后,移动近两年趋势增长十分大,让越来越多的站长认识到了这一点。以后站长不单要学习PC站优化,还要学习移动端的优化,多方向发展学习才不会让社会所抛弃。当然,用户体验是相同,相信用户还是最基础的地方了。

  移动适配涉及正则表达式,但由于很多站长并非技术出身,所以在为网站做移动适配的时候总是力不从心,甚至于一筹莫展。百度一直不断在降低适配的难度,这一次还急站长之所急,在站长平台提供了移动适配中可能使用到的各种正则表达式代码。本着授人以鱼不如授人以渔的原则,潇湘驭文详解了各种正则表达式中字符所代表的含义,让各位站长不仅知其然,还能知其所以然:

  正则表达式规则、详解和示例代码

  1、纯数字适配规则:([0-9]+)或(\d+)

  解释:

  方括号:[]表示字符组,作用是匹配其中一个。如:[1234]代表匹配1、2、3、4四个数字中的一个。

  连字符:-表示一个范围。如:[1-4]等价于[1234]、[a-z]等价于[abcdefghijklmnopqrstuvwxyz]。

  加号:+表示与之紧邻的元素必须出现一次或者多次。如:[0-9]+代表匹配至少2个数字以上的纯数字组合。比如:01、10、100、1232、134341324132……

  \d:Perl等编程语言中用\d代表纯数字,算是一种简化。所以[0-9]等价于\d。

  括号:()划定多选结构的范围。在百度移动适配中所有的正则表达式都需包含在()中。

  纯数字移动适配示例:

  http://www.baidu.com/123456.html -> http://m.baidu.com/123456.html

  适配规则:

  http://www.baidu.com/([0-9]+).html或者http://www.baidu.com/(\d+).html -> http://m.baidu.com/${1}.html

  2、纯字母适配规则:([a-zA-Z]+)

  解释:与纯数字一样。这里面包含大小写字母。里面的顺序无所谓,也可以写成([A-Za-z]+)。

  [a-zA-Z]等价于[abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ]。

  [a-zA-Z]+代表匹配至少2个字母以上的纯字母组合。比如:aa、BB、aBc、AzdbD……

  纯字母移动适配示例:

  http://www.baidu.com/abcd.html -> http://m.baidu.com/abcd.html

  适配规则:

  http://www.baidu.com/([a-z]+).html -> http://m.baidu.com/${1}.html

  3、字母与数字混合适配规则:([a-zA-Z0-9]+)或(\w+)或((?:[a-zA-Z]+[0-9]+|[0-9]+[a-zA-Z]+)[a-zA-Z0-9]+)。

  解释:严格来讲[a-zA-Z0-9]+可以匹配纯字母、纯数字和字母与数字的混合。

  竖线|:匹配任意子表达式,也称为多选分支,可以用()来划定多选结构的范围。如h(a|e)llo,可以匹配:hallo,hello。

  \w:Perl等编程语言中用\w代表[a-zA-Z0-9],算是一种简化。所以[a-zA-Z0-9]+等价于(\w+),但是百度并未在最新的文档中提到\w+,大约是因为这个正则表达式粒度太大,适配效果没那么好。

  百度绝口不提\w+,但却提供:((?:[a-zA-Z]+[0-9]+|[0-9]+[a-zA-Z]+)[a-zA-Z0-9]+),当你的URL中数字与字母交替至少过一次,则可以使用这种。

  (?:正则)这种格式表示匹配正则,但不捕获匹配的文本,也不给此分组分配组号。

  字母与数字混合移动适配示例:

  http://www.baidu.com/abcd1234.html -> http://m.baidu.com/abcd1234.html

  适配规则:

  http://www.baidu.com/([a-zA-Z0-9]+).html -> http://m.baidu.com/${1}.html

  再如:字母与数字至少交替一次

  http://www.baidu.com/ab12cd34.html -> http://m.baidu.com/ab12cd34.html

  适配规则:

  http://www.baidu.com/((?:[a-zA-Z]+[0-9]+|[0-9]+[a-zA-Z]+)[a-zA-Z0-9]+).html -> http://m.baidu.com/${1}.html

  4、确定有中文字符的适配规则:((?:%[a-zA-Z0-9]{2,})+)

  解释:

  区间{min,max}:规定重复次数的范围。{2,}表示至少重复2次,没有上限。

  当URL中含有中文,百度会用gb2312去编码。如“潇”这个中文会被编码成:%E4%EC

  那么%[a-zA-Z0-9]{2,}就可以匹配%XX这样的规则了。%[a-zA-Z0-9]{2,})+也就是匹配中文的规则。

  中文URL适配规则示例:

  http://www.baidu.com/潇湘驭文/ -> http://m.baidu.com/潇湘驭文/

  适配规则:

  http://www.baidu.com/((?:%[a-zA-Z0-9]{2,})+)/ -> http://m.baidu.com/${1}/

  5、确定有参数的适配规则:([^&]+)

  解释:

  脱字符^:出现的位置不同,表达的意思有别。

  1、当^出现在字符组[]中的第一位时[^…],表示只匹配未列出的字符。如:[^&]表示匹配除了&之外的任意字符。

  2、当^不在[]中,则表示行的起始位置。如:^a表示匹配所有以a开头的行。

  参数URL适配规则示例:

  http://www.baidu.com/s?wd=爱裙海 ->http://m.baidu.com/s?wd=爱裙海

  适配规则:

  http://www.baidu.com/s?wd=([^&]+) -> http://m.baidu.com/s?wd=${1}

  6、URL中含有-和_的适配规则:

  解释:

  这个只要为-和_连接的各个部分分别做规则适配即可,不再赘述。

  -和_URL适配规则示例:

  http://www.aiqunhai.com/fushi-index.html -> http://m.aiqunhai.com/fushi-index.html

  适配规则:

  http://www.aiqunhai.com/([a-zA-Z]+)-([a-zA-Z]+).html -> http://m.aiqunhai.com/${1}-${2}.html